早稲田大学修士1年です。LINE Research Labsのアルバイトで音響信号処理の研究をしています。
2018年の夏インターンに参加し、その延長としてResearch Labsでアルバイトをしている中込 優です。アルバイトでは、「複数人の発話から目的の人の発話のみを取り出す技術」について研究しています。 インターンで取り組んだ内容を2019年3月度 音声(SP)・応用/電気音響(EA)・信号処理(SIP)研究会で発表し、音声研究会学生ポスター賞を頂くことができました[1]。その研究内容について紹介します。 背景 近年、スマートフォンやスマートスピーカーや車、会議システムなどに音声認識技術が多く実用化されています。しかし、雑音が多い状況や複数人が同時に話している状況では、音声認識の性能は大きく劣化することが知られています。 そこで、音声認識の前段階として、目的の話者の音声のみを歪みなく抽出する(音声強調)ことが重要になり、盛んに研究されてきました。特に、複数人が同時に話している音声などでは、話者の違いなどに基づき、それぞれの話者の音声を分離し、その後に目的の話者の音声を抽出する技術が研究されてきました。 しかし、全ての話者を分離するには繰り返し計算や数秒間の入力信号が必要になったり、ま